经典机器学习
欢迎来到《人工智能导论》(COMP5511)第6讲。本节课将理论基础与实际算法实现相连接。尽管现代人工智能常强调深度学习,但经典机器学习仍是数据分析的基石。这些算法具有高度的可解释性和计算效率,因此成为处理结构化数据和行业标准分析的首选方案。
1. 监督学习
该范式通过在带标签的数据集上训练模型,使算法学习输入特征与特定目标输出之间的关系。这使得模型能够准确地预测结果对新的、未见过的数据进行准确预测。
- 决策树:将数据划分为分支以得出分类或数值判断的模型。
- 支持向量机(SVM):寻找最优超平面以最大化不同数据类别之间的间隔。
2. 无监督学习
这些算法分析无标签数据以发现隐藏的模式、结构或分组,而无需事先知道输出应为何种形式。主要技术包括:
- K均值聚类:基于特征相似性将数据点分入K个不同的组。
- 主成分分析(PCA):一种降维技术,用于在保留数据核心方差的同时简化复杂数据。
可解释性与复杂性的权衡
经典机器学习的一个显著优势是其透明性。与“黑箱”式的深度学习模型不同,像决策树这样的算法允许人类追溯预测背后的精确逻辑,这对医疗或金融等高风险领域至关重要。
Scikit-learn 实现流程